Reentrenamiento: Aprendizaje Semisupervisado de los Sentidos de las Palabras

نویسندگان

  • Armando Suárez
  • Manuel Palomar
  • German Rigau
چکیده

This paper presents re-training, a bootstrapping algorithm that automatically acquires semantically annotated data, ensuring high levels of precision. This algorithm uses a corpus-based system of word sense disambiguation that relies on maximum entropy probability models. The re-training method consists of the iterative feeding of training-classification cycles with new and high-confidence examples. The process relies on several filters that ensure the accuracy of the disambiguation by discarding uncertain classifications. This new method is inspired by co-training algorithms, but it makes stronger assumptions on when to assign a label to a linguistic context.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Estudio sobre métodos tipo Lesk usados para la desambiguación de sentidos de palabras

Resumen. La ambigüedad semántica es un problema que se presenta en todos los lenguajes naturales. Podríamos decir que para los seres humanos la ambigüedad en el lenguaje pasa desapercibida, debido a que la resolvemos casi inconscientemente utilizando la realidad en que vivimos, el contexto y el conocimiento que poseemos sobre algunos temas. Pero para las computadoras no es así. En el área de pr...

متن کامل

Un Algoritmo Genético para Aprendizaje de un Sistema Basado en Reglas Difusas tipo Takagi Sugeno

Resumen— Este trabajo presenta un método de aprendizaje de la base de conocimiento de un Sistema Basado en Reglas Difusas tipo Takagi Sugeno mediante ejemplos. Para el aprendizaje de las particiones difusas utilizadas en los antecedentes se utiliza un Algoritmo Genético que incluye tanto el número de etiquetas de cada partición como la semántica de dichas etiquetas. Para el aprendizaje de las r...

متن کامل

Hipermedia, Adaptación, Constructivismo e Instructivismo

Los sistemas tutores inteligentes representan a los sistemas interactivos para el aprendizaje instructivo que han surgido hasta el momento. Los sistemas hipermedia permiten la incorporación de nuevos métodos de aprendizaje, como el constructivo, que hasta ahora habían estado hibernando. La piedra angular de este enfoque reside en la cesión del control al alumno sobre su aprendizaje. En el artíc...

متن کامل

[Implicit cognition: a factor to consider in medical education].

RESUMEN La existencia de prejuicios, a menudo inconscientes, es una limitación para la empatía médica y la relación médico-paciente. El término cognición implícita se refiere a las influencias inconscientes (conocimiento previo, percepción y memoria) que, al influir en el comportamiento de las personas, afecta su desempeño o la propia toma de decisiones. A través del aprendizaje, asimilamos la ...

متن کامل

Valoración De Experiencias De Formación Universitaria Apoyadas en El Entorno Moodle

Esta comunicación presenta los resultados de un estudio sobre los cambios que se observan en la actitud de los estudiantes universitarios hacia las actividades de aprendizaje facilitadas por un entorno virtual, las limitaciones que encuentran al hacerlo, y el grado en que consideran que la formación presencial apoyada en entornos virtuales responde a su expectativas de desarrollo de competencia...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 34  شماره 

صفحات  -

تاریخ انتشار 2005